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摘要 :【 目的] 测序 和 分 析 黄 侧 异 腹 胡 蜂 Parapolybia crocea 线粒体 基因 组 ,并 在 线粒体 基因 组 水 平 
探讨 异 腹 胡 蜂 属 Parapolybia 在 胡 蜂 科 中 的 系统 发 育 地 位 。【 方 法】 用 Humina 二 代 测 序 技术 测定 
黄 侧 异 腹 胡 蜂 线粒体 基因 组 全 序列 ,分 析 其 结构 特点 和 碱 基 组 成 ;使 用 最 大 似 然 法 (maximum 
likelihood, ML) 构建 胡 蜂 科 7 个 种 线粒体 基因 组 的 系统 发 育 树 ,分 析 其 在 胡 蜂 科 中 的 系统 发 育 关 
系 。【 结果】 黄 侧 异 腹 胡 蜂 线 粒 体 基 因 组 全 长 16 619 bp(GenBank 登录 号 : KY679828) ,包含 13 个 
蛋白 质 编码 基因 ,22 个 tRNA 基因 ,2 个 rRNA 基因 (rrnS 和 rrnL) 和 1 个 控制 区 ,基因 排列 顺序 与 扒 
测 的 昆虫 祖先 序列 不 完全 一 致 ;全 部 蛋白 质 编码 基因 的 起 始 密码 子 均 为 ATN ,终止 密码 子 除 CYTB 
和 ND] 为 TAG 外 ,其 余 均 为 TAA; 除 tRNA?" C9? 的 DHU 辟 缺 失 外 ,其 他 tRNA 均 能 折 受 成 典型 的 
三 叶 草 结构 ;控制 区 中 存在 一 个 18 bp 的 T-stretch 结构 和 2 段 囊 联 重复 序列 。 胡 蜂 科 7 个 种 基于 
线粒体 基因 组 的 系统 发 育 关 系 表现 为 螺 赢 亚 科 + ( 胡 蜂 亚 科 + 马蜂 亚 科 ) , 异 腹 胡 蜂 属 与 马蜂 必 
Polistes 同属 于 马蜂 亚 科 。[【 结论 ] 黄 侧 异 腹 胡 蜂 线粒体 基因 组 存在 基因 重 排 现象 。 基 于 线粒体 基 
因 组 的 胡 蜂 科 系 统 发 育 关系 与 传统 的 形态 分 类 学 结果 一 致 : 异 腹 胡 蜂 属 隶属 于 马蜂 亚 科 ,马蜂 亚 科 
与 胡 蜂 亚 科 的 亲缘 关系 较 其 与 螺 语 亚 科 更 近 。 
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Sequencing and analysis of the complete mitochondrial genome of 
Parapolybia crocea ( Hymenoptera: Vespidae) 

PENG Yan, CHEN Bin, LI Ting-Jing* ( Chongqing Key Laboratory of Vector Insects, Chongqing Key 
Laboratory of Animal Biology, Institute of Insect and Molecular Biology, Chongqing Normal University, 
Chongqing 401331 , China) 


Abstract: [ Aim] To sequence and analyze the complete mitochondrial genome of Parapolybia crocea, 





and to explore the phylogenetic position of Parapolybia in Vespidae based on mitochondrial genome 
sequences. [Methods] The complete mitochondrial genome of P. crocea was sequenced by using Illumina 
sequencing technique, and its general features and base composition were analyzed. The phylogenetic 
tree of mitochondrial genomes of seven vespid species was constructed by using maximum likelihood 
method, and their phylogenetic relationships within Vespidae were analyzed. [ Results ] The 
mitochondrial genome of P. crocea is a circular molecule of 16 619 bp ( GenBank no. ; KY679828) , 
including 13 protein coding genes, 22 tRNA genes, two rRNA genes ( rrn$ and rrnL) , and one control 
region (CR). The gene arrangement of P. crocea is not completely consistent with the putative ancestral 
sequence of insects. All protein-coding genes initiate with the start codon ATN. The stop codon of these 
genes is TAA, except for CYTB and ND1 which terminates with TAG. All the predicted tRNAs show the 


AS AGN) 


classic clover-leaf structure, except for the absence of DHU arm of tRN . The control region 


contains one 18 bp T-stretch structure and two tandem repeat sequences. The phylogenetic relationships 
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of seven species within Vespidae based on the mitochondrial genomes present as Eumeninae + ( Vespinae 


+ Polistinae), and Parapolybia and Polistes are grouped into the subfamily Polistinae. [ Conclusion] 


Gene rearrangement exists in the mitochondrial genome of P. crocea. The phylogenetic relationships of 


Vespidae constructed based on the mitochondrial genomes are consistent with those in traditional 


morphological taxonomy : Parapolybia is grouped into Polistinae, and the relationship between Polistinae 


and Vespinae is closer than that between Polistinae and Eumeninae. 


Key words: Hymenoptera; Vespidae; 


phylogentic relationship 


动物 线粒体 基因 组 是 一 个 大 小 为 15 - 18 kb 的 
双 链 闭合 环 状 分 子 ( Wolstenholme, 1992; Boore, 
1999; Cameron, 2014) ,具有 结构 简单 、 基 因 重 组 极 
少 、 母 系 遗 传 和 进化 速率 较 快 等 特点 (Song et al., 
2016b) ,是 系统 发 育 和 种 群 遗 传 研究 的 重要 分 子 标 
记 。 膜 翅 目 ( Hymenoptera ) 线粒体 基因 组 除了 上 述 
特征 外 ,还 具有 A +T 含 量 通 常 较 其 他 目 高 ( Dowton 
and Austin, 1997; Cameron et al., 2008; Wei, 
2010) , 且 基 因 重 排 现 象 较 明 显 的 特点 。 如 细 腰 亚 
H ( Apocrita ) K) Œ HPK a F EE H (Symphyta ) 












































Parapolybia; Parapolybia crocea; 


mitochondrial genome; 


还 有 1 个 富 含 AT 的 控制 区 (Boore，1999 ) 。 
HEIE Parapolybia 昆虫 是 社会 性 昆虫 , 常 
在 树干 墙壁、 房 缘 等 地 方 筑 梨 , 主要 以 鳞 翅 目 
( Lepidoptera) 昆虫 的 幼虫 为 食 , 是 一 类 重要 的 天 政 
昆虫 。 该 属 创 建 于 1854 4 (Saussure, 1853 - 
1858) , Richards ( 1962 ) 将 其 归 为 马蜂 亚 科 Polybiini 
族 ( Carpenter, 1993), 我 国学 者 李铁生 (1982， 
1985) 记述 为 异 腹 胡 蜂 科 , 直到 Carpenter ( 1993 ) 通 
过 形态 特征 对 胡 蜂 科 分 类 系统 进行 探讨 ,将 异 腹 胡 
蜂 属 归 为 马蜂 亚 科 Ropalidiini 族 ,并 沿用 至 今 。 目 











L 
























































D 











(Jermiin and Crozier, 1994) , 重 排 事 件 主要 发 生 在 
tRNA 基因 。 与 昆虫 纲 其 他 类 群 线粒体 基因 组 相似 ， 
膜 翅 目 线粒体 基因 组 编码 37 个 基因 ,包括 13 个 蛋 
白质 编码 基因 ,22 个 tRNA 基因 和 2 个 rRNA 基因 ， 


前 ,该 属 尚 无 线粒体 基因 组 序列 报道 ,整个 胡 蜂 科 也 
仅 报 道 了 6 种 线粒体 基因 组 :马蜂 亚 科 2 种 、 胡 蜂 亚 
科 3 种 及 螺 详 亚 科 1 种 ( 表 1)。 














表 1 已 报道 线粒体 基因 组 的 胡 蜂 科 种 类 


Table 1 Species with their mitochondrial genomes known in Vespidae 



































亚 科 种 GenBank 登录 号 参考 文献 
Subfamily Species GenBank accession no. References 
黄 侧 异 腹 胡 蜂 Parapolybia crocea KY679828 本 文 This paper 
马蜂 亚 科 Polistinae IRI Polistes humilis EU024653 Cameron et al., 2008 
约 马蜂 Polistes jokahamae KR052468 Song et al., 2016a 
双色 胡 蜂 Vespa. bicolor KJ735511 Wei et al., 2014 
胡 蜂 亚 科 Vespinae 金 环 胡 蜂 Vespa mandarinia KR059904 Chen et al., 2015 
德国 黄 胡 蜂 Vespula germanica KR703583 Zhou et al., 2016 
JA AJP £|: Eumeninae mi F BE BUSA, Abispa ephippium NC011520 Cameron et al., 2008 








黄 侧 异 腹 胡 蜂 Parapolybia crocea 主要 分 布 于 中 
国 (贵州 广东 广西、 陕西、 江西 湖北 湖南、 安徽 、 
福建 和 云南 等 ) 日本、 泰国 老挝 和 越南 。 本 研究 
测序 和 分 析 黄 侧 异 腹 胡 蜂 线粒体 基因 组 ,在 报道 该 
种 线粒体 基因 组 特点 的 同时 ,从 线粒体 基因 组 水 平 
探讨 异 腹 衣 蜂 属 在 胡 蜂 科 中 的 分 类 地 位 ,并 结合 已 
报道 的 胡 蜂 科 6 个 种 线粒体 基因 组 全 序列 分 析 各 亚 
科 之 间 的 系统 发 育 关 系 ,为 后 续 从 线粒体 基因 组 水 
平 研 究 胡 蜂 科 各 亚 科 、 各 属 及 种 类 间 的 系统 发 育 关 


























系 提供 研究 基础 。 
1 材料 与 方法 


1.1 材料 

黄 侧 异 腹 胡 蜂 Parapolybia crocea 标本 于 2015 年 
8 月 11 日 采集 自重 庆 市 云 阳 县 农 坝 镇 (31. 22°N， 
108. 44°E {FIR 673 m) ,采集 地 的 生态 环境 主要 以 
农田 为 主 , 属 高 寒 地 区 ,雨量 适中 ,常年 平均 气温 
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18C 左 右 。 采 集 后 的 标本 保存 于 无 水 酒精 ,储存 在 
-20% 冰箱 中 。 
1.2 AMARA A DNA 提取 

总 DNA 提取 自 黄 侧 异 腹 胡 蜂 标 本 的 胸部 肌肉 ， 
采用 DNeasy DNA Extraction Kit ANJA (QIAGEN), 
参照 说 明 书 进行 总 DNA 的 抽 提 ,提取 完毕 后 ,用 双 
f DNA 超 敏 试剂 盒 ( Invitrogen ) 中 的 Qubit 荧光 计 
检测 总 DNA 质量 。 
1.3 序列 测定 

本 研究 采用 集合 多 物种 DNA 混合 建 库 的 方式 ， 
通过 高 通 量 测序 技术 完成 测序 工作 ( 贝 瑞 和 康 ) o 
取 每 个 样品 5.0 pg 的 基因 组 DNA 构建 Humina 
TruSeq 文库 ,平均 插入 片段 长 度 为 480 bp, 用 
Illumina Hiseq 2500 对 文库 进行 双 端 测序 ,平均 测序 
深度 为 50X ,保证 总 数据 量 为 4 G(250 bp Reads), 
移 除 连接 物 和 不 配对 、 短 小 \ 质量 差 的 Reads 后 ,将 
高 质量 的 Reads 用 IDBA-UD 进行 从 头 组 装 (Peng et 
al., 2012) , 
1.4 序列 识别 

参考 Simon 等 (2006 ) 设计 的 引物 ,通过 标准 
PCR 反应 扩 增 各 种 线粒体 基因 组 蛋白 质 编码 基因 
COX1 fll rRNA 基因 rrnS 的 基因 片段 ,作为 识 标 序列 
对 线粒体 基因 组 全 序列 进行 BLASTN 查找 ,配对 率 
达到 100% 才 确 认为 黄 侧 异 腹 胡 蜂 基 因 组 。 对 线 粒 





















































1.6 系统 发 育 分 析 

VA 5j 1] SE RE 2 2 OR ZR tae BO BUE TR AC C 
Solenopsis richteri 7j 9| #Ë ( Brothers, 1999; Gotzek, 
2010; Song et al., 2016a) ,选用 NCBI 中 可 获得 的 胡 
VERE 6 个 种 和 本 研究 中 测 得 的 黄 侧 异 腹 胡 蜂 线 粒 体 
基因 组 ,基于 13 个 蛋白 质 编码 基因 的 核 音 酸 序列 构 
建 胡 蜂 科 的 系统 发 育 树 。 将 胡 蜂 科 的 7 个 种 和 1 个 
外 群 线粒体 基因 组 的 13 个 蛋白 质 编码 基因 序列 串 
联 , 用 Clustal X 进行 比 对 ,分 别 采 用 PAUP 4.0 和 
MEGA 6 软件 预测 其 建树 的 最 适 模型 , 均 选 择 最 大 
似 然 法 (maximum likelihood , ML) 用 Bootstrap(1 000 
次 重复 ) 检验 各 分 支 节点 的 置信 值 , 构建 两 种 
ML 树 。 




















2 结果 


2.1 黄 侧 异 腹 胡 蜂 线粒体 基因 组 结构 

黄 侧 异 腹 胡 蜂 的 线粒体 基因 组 全 长 16 619 bp 
( GenBank 登录 号 :KY679828 ) ,与 昆虫 纲 部 分 昆虫 
类 似 ( Wolstenholme 1992; Cha et al., 2007; Zhao et 
al., 2015; Luo et al., 2016) ,基因 组 共 包 括 37 个 基 
因 ( 表 2) :13 个 和 蛋白质 编码 基因 、22 个 tRNA 基因 
和 2 个 rRNA 基因 (rms 和 rrnL) ,还 有 1 个 控制 区 。 
其 中 ,14 个 基因 在 N 链 上 编码 :4 个 蛋白 质 编 码 基 














体 基 因 组 序列 相同 或 接近 相同 的 重 钱 端 区 域 采用 在 
线 软件 Geneious (http://www. geneious. com/) 进行 
人 工 查 验 ,并 在 可 能 的 情况 下 将 其 环 化 。 此 外 ,采用 
PCR 扩 增 目的 条 带 , 切 胶 回 收 后 克隆 测序 的 方法 对 
黄 侧 异 腹 胡 蜂 的 控制 区 序列 进行 验证 。 
1.5 序列 注释 及 特征 分 析 

以 已 知 的 马蜂 亚 科 线粒体 基因 组 作为 参考 ,用 
在 线 软 件 tRNAscan-SE 1. 0 ( http://lowelab. ucsc. 
edu/tRNAscan-SE ) 预测 能 够 生成 的 tRNA 基因 , 通 
过 人 工 比 对 来 注释 蛋白 质 编码 基因 以 及 该 软件 无 法 
识别 的 tRNA 基因 、rRNA 基因 和 控制 区 。 使 用 
MEGA 6( Tamura et al., 2013) 计算 基因 的 核 苷 酸 组 
成 ,包括 AT 含量 .AT 偏 斜 .GC 偏 余 ,并 分 析 蛋 白质 
编码 基因 的 氮 基 酸 含量 和 同 义 密 码 子 相对 使 用 度 
(relative synonymous codon usage, RSCU) tRNA 基 
因 的 二 级 结构 同样 用 tRNAscan-SE 1.0 进行 预测 ， 
无 法 预测 的 则 通过 人 工 校正 完成 。 用 软件 Tandem 
Repeats Finder 4. 09 对 控制 区 的 串联 重复 序列 进行 
查找 ,绘制 控制 区 的 结构 图 。 


















































因 8 个 tRNA 基因 和 2 个 rRNA 基因 ,其 余 23 个 基 
因 在 J 链 上 编码 。 控 制 区 长 度 为 1 316 pp ,位 于 rrnS 
基因 与 tRNA 基因 之 间 。 黄 侧 异 腹 胡 蜂 的 线粒体 
基因 排列 顺序 与 昆虫 假想 的 祖先 序列 不 完全 一 致 
(Clary and Wolstenholme, 1985; Hua et al., 2016) , 
存在 基因 重 排 现 象 (图 1) ,例如 tRNA 基因 从 
IRNAY 基因 和 和 蛋白 质 编码 基因 COX1 之 间 重 排 到 了 
控制 区 的 下 游 和 tRNA™" 基 因 的 上 游 ;蛋白 质 编码 基 
NDI 与 RNA 7 基因 的 位 置 发 生 了 互 换 , 形 成 
基因 艇 traS2-trnL1-ND1 。 

黄 侧 异 腹 胡 蜂 线 粒 体 基因 组 中 ,有 7 处 基因 重 
从, 共 23 bp ,其 中 最 长 的 一 处 重 三 序列 为 8 bp ,位 于 
tRNA 基因 和 tRNA 基因 之 间 , 其余 长 度 为 1 ~7 
bp; 基 因 之 间 的 间隔 区 域 有 21 处 , 共 643 bp, KEN 
1 ~135 bp 不 等 ,其 中 tRNA 基因 和 ND2 之 间 的 基 
因 间 隔 最 长 ;共有 9 处 的 基因 直接 相 邻 。 

2.2 黄 侧 异 腹 胡 蜂 线 粒 体 基因 组 核 音 酸 组 成 

黄 侧 异 腹 衣 蜂 线粒体 基因 组 中 ,和 A 碱 基 占 

43.496 ,T 碱 基 占 39. 6% ,C 碱 基 占 11. 1% ,G 碱 基 
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表 2， 黄 侧 异 腹 胡 蜂 线 粒 体 基因 组 组 成 


Table 2 Composition of the mitochondrial genome of Parapolybia crocea 








基因 方向 起 始 位 置 ”终止 位 置 ”大 小 (bp) 反 密 码 子 ”起 始 密码 子 ”终止 密码 子 与 下 一 基因 的 间隔 (bp) 

Gene Direction Start position Stop position Size Anticodon Start codon Stop codon Length to the next gene 
tRNA! F 1 65 65 GAT 27 
tRNA®™ F 80 146 67 TTG 14 
tRNAMe F 148 215 68 CAT 1 
ND2 F 351 1274 924 ATA TAA 135 
tRNA TP F 1 274 1 352 79 TCA -1 
tRNA R 1 345 1410 66 GCA -8 
COX1 F 1414 2 952 1 539 ATG TAA 3 
tRNALe"(UUR) F 2971 3 039 69 TAA 18 
COX2 F 3 040 3 729 690 ATT TAA 0 
tRNADs F 3731 3 799 69 CTT 1 
tRNA AP F 3 837 3 903 67 GTC 37 
47P8 F 3 904 4071 168 ATT TAA 0 
47P6 F 4 079 4741 663 ATG TAA 7 
C0X3 F 4 780 5 565 786 ATG TAA 38 
tRNA®Y F 5 568 5 635 68 TCC 2 
ND3 F 5 636 5 992 357 ATT TAA 0 
tRNAAR F 5 997 6 062 66 TGC 4 
tRNA F 6 062 6 130 69 TCG -1 
tRNA An F 6 148 6 215 68 GTT 17 
tRNASe(ACN) F 6 213 6 274 62 TCT -3 
tRNA®™ F 6 281 6 347 67 TTC 6 
tRNA ™® R 6 350 6 422 73 GAA 2 
ND5 R 6 463 8 133 1671 ATT TAA 40 
tRNAs R 8 178 8 241 64 GTG 44 
ND4 R 8 274 9 590 1317 ATG TAA 32 
ND4L R 9 584 9 865 282 ATT TAA BT 
tRNAT™ F 9 923 9 986 64 TGT 57 
tRNA®™ R 9 986 10 053 68 TGG -1 
ND6 F 10 089 10 616 528 ATG TAA 35 
CYTB F 10 617 11 759 1 143 ATG TAG 0 
tRNASe(UCN) F 11 758 11 825 68 TGA = 
tRNAIe"(CUN) R 11 841 11 905 65 TAG 15 
NDI R 12 014 12 967 954 ATT TAG 108 
rrnL R 12 968 14 391 1 424 0 
tRNA Va R 14 392 14 460 69 TAC 0 
rrnS R 14 461 15 212 752 0 
控制 区 Control region 15 213 16 528 1 316 0 
tRNA Tr R 16 529 16 593 65 GTA 0 





F; 正 向 Forward; R: Jz [5] Reverse. 
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l 黄 侧 异 腹 胡 蜂 线粒体 基因 组 结构 图 
Fig. 1 











Structure of the mitochondrial genome 

of Parapolybia crocea 
加 下 划 线 的 基因 表示 在 N 链 上 编码 , 其 余 基 因 在 J 链 上 编码 ; 填充 
的 颜色 框 表示 不 同 的 tRNA 基因 ,用 对 应 的 氨基 酸 单字 母 表示 ; 未 
填充 颜色 的 白色 框 分 别 表 示 蛋 白质 编码 基因 rRNA 基因 和 控制 区 。 


The genes underlined are located on the N-strand and others on the J- 



















































































strand. The color-filled blocks denote tRNA genes, which are indicated 
by one letter amino acid code of the corresponding amino acid. The white 


blocks denote protein-coding genes, rRNA genes and the control region, 





(H 5.996 ,全 基因 组 的 A+T 含 量 为 82.9% , G + C 
含量 为 17. 196 ,表现 出 明显 的 对 A 和 了 T 碱 基 的 偏向 
性 ( 表 3)。 和 蛋白 质 编码 基因 全 长 11 022 bp, A + T 
含量 为 80.6% ,G + C REN 19.4% ;代表 氨基 酸 的 
密码 子 第 3 位 碱 基 使 用 AZT 碱 基 的 频率 为 90. 896 , 
明显 高 于 第 1 位 的 77.4% 和 第 2 位 的 73.7% 。 密 
码 子 的 第 3 位 碱 基 大 多 为 A 碱 基 或 工 碱 基 的 现象 
在 膜 翅 目 线粒体 基因 组 中 较为 常见 (Song et al., 
2016b) 。22 个 tRNA 基因 序列 总 全 长 为 1 486 bp, 
A +T 含 量 为 86. 1% 。2 个 TRNA 基因 全 长 为 2 176 
bp,A + 了 含量 为 86. 3%。 控 制 区 序列 长 度 为 1 316 
bp,A +T EX 88. 3% , 

黄 侧 异 腹 胡 蜂 线粒体 基因 组 全 序列 的 AT J sb 
为 正 值 (0. 046) ,GC 偏 斜 为 负 值 ( -0.307) ,表明 基 
因 组 序列 中 A 碱 基 和 C 碱 基 的 百分比 含量 高 于 T 
碱 基 和 G 碱 基 , 与 大 部 分 昆虫 的 线粒体 基因 组 AT/ 
GC 偏 糙 一 致 ( Wei et al. , 2010) 。 和 蛋白 质 编码 基因 
的 AT 偏 斜 为 负 ( — 0.12096) , GC 偏 斜 也 为 负 
( -0.015% ) ,其 中 ,位 于 丁 链 上 的 9 个 蛋白 质 编码 
基因 的 AT WRA GC 偏 斜 均 为 负 ,N 链 编码 的 4 个 
和 蛋白质 基因 AT 偏 斜 为 负 ,tRNA 基因 AT 偏 斜 为 正 ， 
rrnL 和 rrmns 基因 AT 偏 斜 为 负 , GC 偏 斜 均 为 正 值 































































































respectively. ( 表 3)。 
RI 黄 侧 异 腹 胡 蜂 线粒体 基因 组 核 并 酸 组 成 
Table 3 Nucleotide composition of the complete mitochondrial genome of Parapolybia crocea 
基因 序列 T C A G A+T G+C AT fil GC [hil 
Gene sequences (96) (96) (96) (96) (96) (6) AT-skew GC-skew 
全 基因 组 Whole genome 39.6 11.1 43.4 5.9 82.9 17.1 0.046 -0.307 
蛋白 质 编 码 基因 Protein-coding genes 45.2 9.8 35.5 9.5 80.6 19.4 -0.120 -0.015 
密码 子 第 1 位 lst codon site 37.9 9.1 39.5 13.5 77.4 22.6 0.021 0.194 
密码 子 第 2 位 2nd codon site 51.3 15.0 22.4 11.3 73.7 26.3 -0.393 -0. 143 
密码 子 第 3 位 3rd codon site 46.2 5.3 44.6 3.9 90.8 9.2 -0.019 - 0. 160 
tRNA 基因 tRNA genes 42.1 6.2 44.0 7.7 86.1 13.9 0.022 0.107 
rRNA 基因 rRNA genes 46.0 4.4 40.3 9.4 86.3 13.7 -0.066 0.365 
控制 区 Control region 46.0 6.5 42.2 5:2 88.3 11.7 -0.043 -0.117 


2.3” 黄 侧 异 上 腹 胡 蜂 线粒体 基因 组 蛋白 质 编码 基因 
本 研究 中 黄 侧 异 腹 胡 蜂 线粒体 基因 组 蛋白 质 编 
码 基 因 均 以 ATN 作为 起 始 密码 子 , 其 中 ND2 使 用 
ATA 作为 起 始 密码 子 , COXI, ATP6, COX3, NDA, 
ND6 和 CYTB 使 用 ATG 作为 起 始 密码 子 , 其 余 6 个 基 
因 均 使 用 ATT 作为 起 始 密码 子 。 除 了 CYTB 和 VD1 
以 TAG 作为 终止 密码 子 ,其 余 编码 基因 的 终止 密码 
子 为 TAA ,与 昆虫 线粒体 基因 组 普遍 使 用 的 终止 密码 





TH TAA 或 TAG 相 一 致 (Wolstenholme ，1992 ) 。 
除去 终止 密码 子 , 黄 侧 异 腹 胡 蜂 线 粒 体 蛋白 质 
编码 基因 共 包 含 3 661 个 密码 子 ,其 在 昆虫 线粒体 
和 蛋白质 编 码 基 因 密 码 子 数 量 在 3 585 ~3 746 范围 内 
(Cha et al., 2007), 。 相 对 同 义 密 码 子 使 用 情况 显 
IR ,其 线粒体 基因 组 对 A 和 了 T 碱 基 具 有 明显 的 偏向 
性 ( 表 4) ,其 中 最 常用 的 4 个 密码 子 是 UUU( Phe)， 
UUA(Leu), AUU( Ile) fil AUA( Met) ,密码 子 使 用 次 
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数 依次 为 346, 486, 431 和 302 ,其 第 3 位 碱 基 均 为 次 分 别 为 le(13. 396), Phe (10. 396) 和 Met 
A 或 U, 说 明黄 侧 异 腹 衣 蜂 线 粒 体 蛋 白质 编码 基因 (8.8% ) ,是 使 用 频率 最 高 的 4 个 氨基 酸 ( 图 2) ,这 
密码 子 第 3 位 偏好 使 用 A sk U 碱 基 。 和 蛋白 质 编码 ”一 现象 在 其 他 膜 翅 目 昆 虫 中 也 很 常见 ( Wei et al., 
基因 的 氨基 酸 百分比 含量 最 高 为 Leu(15.7%), 其 2009)。 








XA 黄 侧 异 腹 胡 蜂 线粒体 基因 组 密码 子 使 用 情况 


Table 4 Codon usage in the mitochondrial genome of Parapolybia crocea 














氨基 酸 密码 子 使 用 次 数 — 同 义 密 码 子 相对 使 用 度 氨基 酸 密码 子 使 用 次 数 ” 同 义 密码 子 相对 使 用 度 
Amino acid Codon n RSCU Amino acid Codon n RSCU 
Phe (F) UUU 346 1.84 Tyr ( Y) UAU 144 1.69 
UUC 31 0.16 UAC 26 0.31 
Leu (L) UUA 486 5.06 Stop codon * UAA 11 1.69 
UUG 35 0.36 UAG 2 0.31 
CUU 24 0.25 His (H) CAU 54 1.69 
CUC 3 0.03 CAC 10 0.31 
CUA 28 0.29 Gln (Q) CAA 48 1.81 
CUG 0 0 CAG 5 0.19 
Ile (1) AUU 431 1.77 Asn (N) AAU 235 1.88 
AUC 55 0.23 AAC 15 0.12 
Met (M) AUA 302 1.88 Lys (K) AAA 134 1.9 
AUG 19 0.12 AAG 7 0.1 
Val ( V) GUU 63 2 Asp (D) GAU 47 1.74 
GUC 0 0 GAC q 0.26 
GUA 56 1.78 Glu (E) GAA 68 1.77 
GUG 7 0.22 GAG 9 0.23 
Ser (S) UCU 93 1.83 Cys (C) UGU 27 1.8 
UCC 9 0.18 UGC 3 0.2 
UCA 100 1.97 Trp (W) UGA 68 1.72 
UCG 1 0.02 UGG 11 0.28 
Pro (P) CCU 51 1.92 Arg (R) CGU 14 1.3 
CCC 13 0.44 CGC 0 0 
CCA 48 1.61 CGA 26 2.42 
CCG 1 0.03 CGG 3 0.28 
Thr (T) ACU 58 1.48 Ser ( AGN) AGU 22 0.91 
ACC 14 0.36 AGC 1 0.04 
ACA 83 2.1 AGA 65 2.68 
ACG 2 0.05 AGG 9 0.37 
Ala (A) GCU 39 2.14 Gly (G) GGU 45 1.09 
GCC 7 0.38 GGC 2 0.05 
GCA 26 1.42 GGA 88 2.13 
GCG 1 0.05 GGG 30 0.73 
n; 密码 子 使 用 次 数 Frequency of a codon used; RSCU: 同 义 密码 子 相 对 使 用 度 Relative synomymous codon usage; “终止 密码 子 Stop codon. 





2.4 黄 侧 异 腹 胡 蜂 线 粒 体 基因 组 tRNA 基因 和 ”平等 , 2015; Hua et al., 2016) ,只 有 tRNA 的 反 密 
rRNA 基因 码 子 由 CCT 变 为 GAT, (RNA “的 反 密码 子 由 

本 研究 的 黄 侧 异 腹 胡 蜂 线 粒 体 基 因 组 具 20 个 GCT 变 为 TCT, 同 时 这 一 现象 也 存在 于 目前 已 报道 
tRNA 基因 的 反 密码 子 , 且 与 多 数 昆 虫 线粒体 基因 组 ”的 胡 蜂 科 其 他 种 类 中 (Cameron et al., 2008; Wei, 
对 应 tRNA 的 反 密 码 子 相 同 (Lee et al., 2008; 王 菊 2014; Chen, 2015; Song et al., 2016a; Zhou et al., 
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图 2 ” 黄 侧 异 腹 胡 蜂 线粒体 基因 组 蛋白 质 编码 基因 编码 蛋白 的 氨基 酸 百分比 含量 



































Fig. 2 Percentage of each amino acid of proteins coded by protein-coding genes of the mitochondrial genome of Parapolybia crocea 


2016) , K TEE% Polistes humilis 中 tRNA 入 的 反 密 
码 子 有 所 不 同 为 AGC 外 ,目前 已 报道 胡 蜂 科 种 类 
与 黄 侧 异 腹 胡 蜂 所 有 tRNA 基因 的 反 密 码 子 均 相 同 
( Cameron et al., 2008) 。 

除 tRNA 缺少 的 双 氧 尿 喀 啶 (DHU) 辟 被 
一 个 环 结构 所 替代 外 ,其 他 tRNA 预测 的 二 级 结构 
均 能 折 礁 成 典型 的 三 叶 草 结构 ,包括 氨基酸 接受 臂 、 
双 氧 尿 喀 啶 辟 、 反 密码 子 臂 、 可 变 臂 以 及 TyC 臂 (图 
3)。 在 三 叶 草 结构 的 折 徐 过 程 中 出 现 19 处 碱 基 错 
配 , 分 别 是 G-U 碱 基 错 配 12 对 ,5 对 存在 于 氨基 酸 
接受 辟 上 ,6 对 存在 于 双 氧 尿 喀 啶 臂 上 ,1 对 存在 于 
TyC EF F; A-C 碱 基 错 配 2 对 ,分 别 出 现 在 氨基 酸 接 
受 辟 和 反 密 码 子 辟 上 ;发 生 在 双 氧 尿 喀 啶 臂 上 的 G- 
A 碱 基 错 配 和 氨基 酸 接 受 辟 上 的 U-U 碱 基 错 配 各 
1 对 。 

与 大 部 分 昆虫 线粒体 基因 组 相 比 (Clary and 
Wolstenholme, 1985; Jiang et al., 2016) , 黄 侧 异 腹 
胡 蜂 线粒体 基因 组 的 rrns 基因 位 置 相同 ,在 tRNA"” 
基因 和 控制 区 之 间 , 相 对 保守 ,而 rrnL 基因 位 置 有 
所 不 同 ,位 于 蛋白 质 编码 基因 INDY 和 tRNA” 基因 
z [B] ,rrnL 和 rrns 长 度 分 别 为 1 424 和 752 bp,A +T 
含量 分 别 为 86. 4% 和 85. 9% ,具有 明显 的 AT 碱 基 
偏向 性 。 

2.5 黄 侧 异 腹 胡 蜂 线粒体 基因 组 控制 区 

黄 侧 异 腹 胡 蜂 线 粒 体 基 因 组 控制 区 是 其 基因 组 
中 序列 最 长 的 非 编 码 区 ,位 于 rrnS 和 tRNA 基因 之 
间 ,长 度 为 1316 bp,A+T 含 量 为 88.3% ,表现 出 明 
显 的 AT 碱 基 偏 向 性 ;控制 区 上 存在 一 段 保守 的 长 
为 18 bp 的 T-stretch 结构 和 2 段 串 联 重复 序列 (图 
4) ,第 一 段 重 复 单位 为 48 bp ,重复 11 KAR, AK 


















































度 562 bp, 位 于 基因 组 的 15 259 ~820 bp 之 间 ; 第 2 
段 重复 单位 为 41 bp ,重复 2 次 有 余 , 总 长 度 共 116 
pp ,位 于 基因 组 的 16 086 ~ 16 201 bp Z J , WW Ez tP 
联 重复 序列 之 间 存 在 292 bp 的 基因 间隔 。 
2.6 黄 侧 异 腹 胡 蜂 在 胡 蜂 科 中 的 系统 发 育 地 位 

以 疏 科 的 黑 火 蚁 为 外 群 ,选用 已 报道 的 6 4° 19] 
蜂 科 种 类 和 本 研究 中 测 得 的 黄 侧 异 腹 胡 蜂 的 线粒体 
基因 组 ,基于 13 个 蛋白 质 编 码 基因 的 核 背 酸 序列 ， 
用 PAUP 4.0 和 MEGA 6 预测 出 的 最 优 模型 均 为 
GTR +G +1, 同 时 采用 最 大 似 然 法 ( ML) 构建 胡 蜂 科 
的 系统 发 育 树 ,两 种 软件 构建 的 系统 发 育 树 拓扑 结 
构 一 致 , 均 具 有 很 高 的 置信 值 ( 图 5)。 

结果 显示 ,在 衣 蜂 科 中 ,马蜂 亚 科 与 衣 蜂 亚 科 聚 
为 一 支 ,3 个 亚 科 之 间 的 系统 发 育 关 系 表 现 为 曙 启 
亚 科 e ( 胡 蜂 亚 科 + 马蜂 亚 科 ) , 亚 科 之 内 各 属 均 明 
显 分 开 , 置 信 值 高 ,分 支 的 可 信和 度 较 高 。 














与 推测 的 昆虫 祖先 序列 相 比 , 膜 翅 目 昆虫 的 线 
粒 体 基 因 组 序列 普遍 存在 基因 重 排 现 象 ,其 中 广 腰 
亚 目的 基因 排列 相 比 细 腰 亚 目 保守 , 重 排 较 少 ,但 仍 
比 其 他 目 昆 虫 重 排 频 繁 (Jermiin and Crozier, 
1994) 。 衣 蜂 科 属于 细 腰 亚 目 , 重 排 事 件 主要 发 生 
在 tRNA 基因 中 ,和 蛋白质 编码 基因 和 TRNA 基因 的 排 
列 顺序 均 相 对 保守 ,并 且 胡 蜂 科 主要 的 重 排 热 点 发 
生 在 基因 得 trnl-trnY ,trnR-NDS 和 ND1-trnLl 之 间 。 
TE, 4E Vy Bb EE WE Polistes humilis 和 约 马 蜂 P. 
jokahamae 已 获得 的 线粒体 基因 序列 中 ,主要 存在 两 
处 基因 重 排 现象 ,分 别 是 tRNA 基因 tRNA ”和 
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图 3 黄 侧 异 腹 胡 蜂 线粒体 基因 组 tRNA 基因 产物 的 二 级 结构 














Fig. 3 Predicted secondary structure of tRNA in the mitochondrial genome of Parapolybia crocea 





tRNA'^ 77? 的 重新 排列 (Cameron et al., 2008; Song — 件 基 本 一 致 ; 胡 蜂 亚 科 获得 完整 线粒体 基因 组 序列 
et al., 2016a) ,本 研究 测定 的 黄 侧 异 腹 胡 蜂 线 粒 体 ”的 种 类 金 环 胡 蜂 Vespa mandarinia 中 存在 4 处 基因 








基因 组 与 已 获得 的 马蜂 亚 科 线粒体 基因 组 的 重 排 事 ” 重 排 ,包括 tRNA AE DSL RUE T, ATA f 
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图 4 黄 侧 异 腹 胡 蜂 线粒体 基因 组 控制 区 结构 


Fig. 4 Structure of the control region in the mitochondrial genome of Parapolybia crocea 











紫色 圆 表 示 第 1 段 


circle denotes the second (41 bp). 


























矮 马 蜂 Polistes humilis EU024653 
约 马 蜂 Polistes jokahamae KR052468 


黄 侧 异 腹 胡 蜂 Parapolybia crocea KY679828 A 
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复 单位 为 48 bp ,粉色 圆 表示 第 2 段 重复 单位 为 41 bp. The purple circle denotes the first repeat unit (48 bp) , while the pink 
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黄 胡 蜂 Vespula germanica KR703583 
双色 胡 蜂 Vespa bicolor KJ735511 
金 环 胡 蜂 Vespa mandarinia KR059904 
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EHR Abispa ephippium NC011520 








上 胡 蜂 亚 科 Vespinae 
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0.606 黑 火 蚁 Solenopsis richteri HQ215539.1 (outgroup) 
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图 5 HERT 个 种 基于 线粒体 13 个 蛋白 质 编码 基因 核 背 酸 序列 的 系统 发 育 树 ( 最 大 似 然 法 ) 


Fig. 5 Phylogenetic tree of Vespidae based on the nucleotide sequences of 13 protein coding genes 


of mitochondrial genomes of seven species ( maximum likelihood method) 
A: 使 用 MEGA 6 构建 的 系统 发 育 树 Phylogenetic tree constructed using MEGA 6; B; 使 用 PAUP 4. 0 构建 的 系统 发 育 树 Phylogenetic tree 
constructed using PAUP 4.0. 以 黑 火 蚁 Solenopsis richteri 为 外 群 。Solenopsis richteri was used as the outgroup. 





trnM 的 重新 排列 ,trnSl 和 trnk 之 间 易 位 以 及 ND1 
和 trnLl 之 间 的 易 位 (Chen et al., 2015) , XX (& tH E 
V. bicolor 和 德国 黄 胡 蜂 Vespula germanica 报道 的 线 
粒 体 基因 组 不 完全 , 仅 在 获得 的 线粒体 基因 中 发 现 
存在 部 分 与 金 环 胡 蜂 类 似 的 重 排 现 象 ( Wei, 2014; 
Zhou et al., 2016) ; W h MP FE H Bi (M JR iB B3 ul 2E B£ 
IREA Abispae phippium 中 重 排 事件 比较 频繁 , 该 线 粒 
体 基因 组 包括 41 个 基因 ,其 中 有 2 个 tRNA 基因 
和 4 个 tRNA 基因 ,至 少 存在 4 次 基因 重 排 事 
件 , 形 成 了 基因 复 irnLl-irnM-irnQ-irnM-irnl , trnL2- 
irnl2-trnL2-trnl2. 和 trnS2-ND1 ( Cameron et al., 
2008)。 因 此 ,从 线粒体 基因 重 排 特 点 判断 , 异 腹 胡 
蜂 属 归 为 马蜂 亚 科 有 其 合理 性 。 

黄 侧 异 腹 胡 蜂 的 tRNA 的 二 级 结构 缺少 
EURIE WE MASAKER T nt 的 环 结构 所 符 
代 , 该 现象 是 后 生动 物 线粒体 基因 组 tRNA 的 一 个 
特征 结构 ( Wolstenholme, 1992) 。 该 种 tRNA 二 级 
结构 中 存在 保守 区 域 ,分 别 为 7 bp 长 的 氨基 酸 接受 





























BERT nt 长 的 反 密 码 子 环 ,其 余 长 度 可 变 的 区 域 一 
般 包括 双 氧 尿 喀 啶 辟 (2 ~4 bp) 、 双 氧 尿 喀 啶 环 (3 ~ 
8 nt) \ 反 密码 子 臂 (4 ~5 bp)、 可 变 环 (4 ~5 nt), 
TYC 辟 (3 ~5 bp) 和 TyC 环 (3 ~9 nt) ,其 中 tRNA™ 
基因 的 可 变 环 中 间 存 在 1 个 5 bp 长 的 臂 ,tRNA™ 基 
因 的 双 氧 尿 喀 啶 环 长 度 达 到 了 13 nt ,使 得 它们 分 别 
成 为 了 长 度 最 长 的 两 个 tRNA 基因 ,这 在 目前 报道 
的 胡 蜂 科 种 类 中 尚未 发 现 ,需要 在 后 续 异 腹 胡 蜂 属 
相关 种 类 的 线粒体 基因 组 研究 中 进一步 收集 并 分 
Vr ,判断 其 是 否 为 该 属 线粒体 基因 组 特有 特征 。 

控制 区 是 线粒体 基因 组 中 最 长 的 一 段 非 编 码 
区 ,一 般 位 于 昆虫 线粒体 基因 组 的 rmn 和 RNA" 基 
因 之 间 , 是 线粒体 基因 组 中 序列 和 长 度 变异 最 大 的 
区 域 ,除了 核 音 酸 之 间 的 替换 ,还 包括 序列 的 缺失 插 
入 ,不 同 程度 的 串联 重复 拷贝 等 ,通常 认为 控制 区 含 
有 线粒体 基因 组 转录 和 复制 的 起 点 (Saito et al., 
2005). 。 黄 侧 异 腹 胡 蜂 的 线粒体 基因 组 控制 区 则 位 
于 基因 组 上 的 ren 和 tRNAY 基 因 之 间 , 是 目前 报道 
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的 胡 蜂 科 线 粒 体 基 因 组 中 控制 区 最 长 的 种 类 。 在 其 
控制 区 上 发 现 了 一 段 长 度 为 18 bp 的 T-stretch 结 
构 , 有 人 推测 该 结构 是 完全 变态 昆虫 线粒体 基因 组 
N 链 复 制 起 始 的 结构 信号 (Saito et al., 2005) ,但 是 
在 胡 蜂 科 其 他 种 类 控制 区 中 未 发 现 长 度 大 于 10 bp 
的 T-stretch 结构 。 黄 侧 异 腹 胡 蜂 控 制 区 中 还 存在 2 
段 重复 单位 分 别 为 48 和 41 bp 的 串联 重复 序列 ,在 
胡 蜂 科 其 他 种 类 控制 区 中 也 发 现 不 同 程度 的 串联 重 
复 结构 ,说 明 胡 蜂 科 线 粒 体 基因 的 控制 区 具有 更 加 
多 样 化 的 结构 特征 。 

基于 胡 蜂 科 7 个 种 的 线粒体 基因 组 蛋白 质 编码 
基因 的 核 苷 酸 序 列 构建 的 ML 系统 发 育 树 分 析 可 以 
看 出 ,它们 之 间 的 系统 发 育 关 系 为 (( Polistes humilis 
+ P. jokahamae) + Parapolybia crocea) + (( Vespa 
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bicolor + V. mandarinia) + Vespula germanica) + 
Abispa ephippium, 马蜂 亚 科 与 胡 蜂 亚 科 的 亲缘 关系 
相 较 于 螺 启 亚 科 更 近 , 这 在 形态 与 分 子 方面 得 到 多 
方面 的 支持 ( Carpenter, 1982; Carpenter and Thi, 
2003) ; 黄 侧 异 腹 关 蜂 属 与 马蜂 属 的 系统 发 育 地 位 
一 致 ,同属 于 马蜂 亚 科 ,这 与 现 沿用 的 形态 分 类 学 观 
点 相 一 致 (Saito-Morooka, 2015) 。 

本 研究 对 黄 侧 异 腹 胡 蜂 线 粒 体 基因 组 全 序列 的 
测定 丰富 了 胡 蜂 科 线 粒 体 基因 组 的 序列 信息 ,为 其 
分 子 系统 进化 分 析 提 供 了 有 益 的 分 子 数据 ;同时 ,对 
其 结构 特点 和 碱 基 组 成 的 分 析 为 对 该 属 的 线粒体 基 
因 组 学 进行 比较 分 析 提 供 了 基础 资料 ;最 后 ,根据 黄 
侧 异 腹 胡 蜂 和 胡 蜂 科 6 个 线粒体 基因 组 序列 已 知 种 
的 13 个 蛋白 质 编码 基因 核 音 酸 序列 构建 的 系统 发 
育 树 分 析 为 该 属 分 类 地 位 的 确立 提供 了 线粒体 基 
组 水 平 上 的 分 子 依据 ,也 为 后 续 胡 蜂 科 系 统 发 生 关 
系 的 构建 初步 莫 定 了 分 子 基础 。 但 目前 胡 蜂 科 线 粒 
体 基因 组 全 序列 的 数据 仍 有 限 ,后 续 需 要 进一步 对 
胡 蜂 科 其 他 属 的 种 类 进行 线粒体 基因 组 测序 和 深入 
分 析 , 从 而 构建 较 合理 的 胡 蜂 科 各 阶 元 间 的 进化 
关系 。 
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